統計学は、データの収集・整理・分析を行い、その結果に基づいて推論や意思決定を行うための学問です。まるで一鍋の八宝粥を味わうように、すべてを飲み干さなくても、よく混ぜて一匙取り出すだけで、全体の味がわかるのです。これが統計調査の魅力です。
コアコンセプト:私たちの主役は誰か?
どんな調査を行う前に、まず対象となる研究対象を明確に定義する必要があります:
- 母集団(Population):調査対象となるすべての対象物。
- 個体:母集団を構成する一つ一つの対象物。
- 標本(Sample):母集団から抽出された一部の対象物。
- 標本サイズ(Sample Size):標本に含まれる個体の数(注:これは数値であり、単位はありません)。
調査方法の選択
なぜ常に全数調査(すべての対象を調査する方法)を行わないのか?
シナリオA:国勢調査
たとえば2010年の第6回国勢調査。極めて高い正確性が求められ、国民の生活に直結するデータであるため、「一人も見逃してはならない」必要があります。
シナリオB:衝撃耐性テスト
ある車両の製造ロットの衝撃耐性を調べる場合、全数調査とはすべての新車を破壊することを意味します。このとき、標本調査(一部の対象を抽出して調査し、全体を推定する)が唯一の選択肢となります。
標本抽出の科学性と落とし穴
「一匙の粥」が「一鍋の粥」を正しく代表できるようにするためには、簡単無作為抽出原則に従い、すべての個体が同じ確率で抽出されるようにしなければなりません。以下の3つの落とし穴には注意が必要です:
- 過小: 標本数が少なすぎると、偶然性が大きくなり、母集団の客観的な状況を反映できなくなります。
- 過大: 時間と労力を節約するという目的を失ってしまいます。
- バイアス: たとえば、周囲の同級生だけを調査して全校の状況を推定しようとする場合、標本は代表的ではありません。
🎯 コアロジック
標本調査の核となるのは、標本データを使って母集団の状況を推定することです。その公式の論理は、$q \approx \frac{p}{n} \times m$ であり、ここで $q$ は母集団の推定値です。